Permulaan proses pengelasan data Pengelasan data (pengurusan data)

Langkah-langkah terawal ialah menilai dan membahagikan pelbagai aplikasi dan data ke dalam kategori masing-masing seperti berikut:

  • Data perhubungan atau berjadual (kira-kira 15% daripada data bukan audio/video):
    • Secara umumnya menerangkan data proprietari yang boleh diakses hanya melalui antara muka pengaturcaraan aplikasi atau aplikasi (API).
    • Aplikasi yang menghasilkan data berstruktur biasanya merupakan aplikasi pangkalan data.
    • Jenis data ini biasanya membawa prosedur penilaian data yang kompleks dan penghijrahan antara peringkat storan.
    • Untuk memastikan standard kualiti yang mencukupi, proses pengelasan perlu dipantau oleh pakar subjek.
  • Data separa berstruktur atau polistruktur (semua data bukan audio/video lain yang tidak mematuhi bentuk di atas yang ditentukan sistem atau platform).
    • Secara amnya menerangkan fail data yang mempunyai struktur semantik dinamik atau tidak berkaitan (cth dokumen, XML, JSON, output peranti atau log sistem, output sensor).
    • Proses pengelasan data yang agak mudah ialah penetapan kriteria.
    • Proses mudah pemindahan data antara segmen yang diperuntukkan bagi peringkat storan yang telah ditetapkan.

Jenis pengelasan data lazim termasuk data geografikal, kronologi, kualitatif (berdasarkan sifat/kualiti) dan kuantitatif (terukur).

Ia juga harus dinilai merentas tiga dimensi:

  1. Kebolehcaman: betapa mudahnya data ini digunakan untuk mengenal pasti individu?
  2. Sensitiviti: berapa banyak kerosakan yang boleh dilakukan jika data ini sampai ke tangan yang salah?
  3. Kekurangan: sejauh manakah data ini tersedia?[2]